Google rezolvă cea mai mare problemă a operelor realizate de inteligența artificială. Cum le identifici

de: Andrei Tilimpea
30 08. 2023

SynthID se va lansa pe platforma Imagen de la Google, dar ar putea fi difuzat la terți mai târziu.

Google a făcut un pas către transparență în imaginile generate de AI. Google DeepMind a anunțat SynthID, un instrument de filigranare/identificare pentru arta generativă.

Compania spune că tehnologia încorporează un filigran digital, invizibil pentru ochiul uman, direct pe pixelii unei imagini. SynthID se lansează mai întâi către „un număr limitat” de clienți care folosesc Imagen, generatorul de artă Google disponibil în suita sa de instrumente AI bazate pe cloud.

Una dintre numeroasele probleme cu arta generativă – în afară de implicațiile etice ale formării asupra muncii artiștilor – este potențialul de a crea deepfakes. De exemplu, noua ținută hip-hop a Papei (o imagine AI creată cu MidJourney) care a devenit virală pe rețelele sociale a fost un exemplu timpuriu al ceea ce ar putea deveni mai banal pe măsură ce instrumentele generative evoluează.

Nu este nevoie de multă imaginație pentru a vedea cum ceva de genul reclamelor politice care utilizează artă generată de AI ar putea face mult mai multe daune decât o imagine amuzantă care circulă pe Twitter.

„Watermarking conținutul audio și vizual pentru a ajuta la clarificarea faptului că tot conținutul este generat de inteligență artificială” a fost unul dintre angajamentele voluntare pe care șapte companii de inteligență artificială au convenit să le dezvolte după o întâlnire din iulie la Casa Albă. Google este prima dintre companii care a lansat un astfel de sistem.

Google nu merge prea departe în mintea implementării tehnice a SynthID (probabil să prevină soluții), dar spune că filigranul nu poate fi îndepărtat cu ușurință prin tehnici simple de editare. „Este dificil să găsești echilibrul potrivit între imperceptibilitatea și robustețea manipulării imaginilor”, a scris compania într-o postare de blog DeepMind.

Imaginea nu va fi compromisă

„Am proiectat SynthID astfel încât să nu compromită calitatea imaginii și să permită ca filigranul să rămână detectabil, chiar și după modificări precum adăugarea de filtre, schimbarea culorilor și economisirea cu diferite scheme de compresie cu pierderi – cel mai frecvent utilizate pentru JPEG”, au scris liderii de proiect SynthID de la DeepMind, Sven Gowal și Pushmeet Kohli.

Partea de identificare a SynthID evaluează imaginea pe baza a trei niveluri de încredere a filigranului digital: detectat, nedetectat și posibil detectat. Deoarece instrumentul este încorporat în pixelii imaginii, Google spune că sistemul său poate funcționa alături de abordări bazate pe metadate, precum cea pe care o folosește Adobe cu funcțiile sale generative Photoshop, disponibile în prezent într-o versiune beta deschisă.

SynthID include o pereche de modele de deep learning: unul pentru watermarking și celălalt pentru identificare. Google spune că cei doi s-au antrenat pe diverse imagini, culminând cu un model ML combinat.

„Modelul combinat este optimizat pentru o serie de obiective, inclusiv identificarea corectă a conținutului cu filigran și îmbunătățirea imperceptibilității prin alinierea vizuală a filigranului la conținutul original”, au scris Gowal și Kohli.

Google a recunoscut că nu este o soluție perfectă, adăugând că „nu este sigură împotriva manipulărilor extreme de imagine”. Dar descrie filigranul ca fiind „o abordare tehnică promițătoare pentru a împuternici oamenii și organizațiile să lucreze cu conținut generat de AI în mod responsabil”. Compania spune că instrumentul s-ar putea extinde și la alte modele AI, inclusiv cele însărcinate cu generarea de text (cum ar fi ChatGPT), video și audio.

Deși filigranele ar putea ajuta cu deepfake-urile, este ușor să ne imaginăm că filigranul digital se transformă într-o cursă a înarmărilor cu hackeri, cu servicii care adoptă SynthID care necesită o actualizare continuă.

În plus, natura open-source a Stable Diffusion, unul dintre instrumentele generative de top, ar putea face ca adoptarea la nivel de industrie a SynthID sau a oricărei soluții similare să devină o problemă mare: are deja nenumărate versiuni personalizate care pot rula pe computerele locale din sălbatic. Oricum, Google speră să pună SynthID la dispoziția terților „în viitorul apropiat” pentru a îmbunătăți cel puțin transparența AI la nivel de industrie.